智能论文笔记

AutoPruner: Transformer-Based Call Graph Pruning

Thanh Le-Cong , Hong Jin Kang , Truong Giang Nguyen , Stefanus Agus Haryono , David Lo , Xuan-Bach D. Le , Huynh Quyet Thang

分类：人工智能

2022-09-07

构建静态呼叫图需要在健全和精度之间进行权衡。不幸的是，用于构建呼叫图的程序分析技术通常不精确。为了解决这个问题，研究人员最近提出了通过机器学习为静态分析构建的后处理呼叫图所授权的呼叫图。机器学习模型的构建是为了通过在随机森林分类器中提取结构特征来捕获呼叫图中的信息。然后，它消除了预测为误报的边缘。尽管机器学习模型显示了改进，但它们仍然受到限制，因为它们不考虑源代码语义，因此通常无法有效地区分真实和误报。在本文中，我们提出了一种新颖的呼叫图修剪技术AutoRoprouner，用于通过统计语义和结构分析消除呼叫图中的假阳性。给定一个由传统静态分析工具构建的呼叫图，AutoProuner采用基于变压器的方法来捕获呼叫者与呼叫图中每个边缘相关的呼叫者和Callee函数之间的语义关系。为此，AutoProuner微型调节模型是在大型语料库上预先训练的代码模型，以根据其语义的描述表示源代码。接下来，该模型用于从与呼叫图中的每个边缘相关的功能中提取语义特征。 AutoProuner使用这些语义功能以及从呼叫图提取的结构特征通过馈送前向神经网络分类。我们在现实世界程序的基准数据集上进行的经验评估表明，AutoProuner的表现优于最先进的基线，从而改善了F量级，在识别静态呼叫图中识别错误阳性边缘方面，高达13％。

translated by 谷歌翻译

An Asymmetric Contrastive Loss for Handling Imbalanced Datasets

Valentino Vito , Lim Yohanes Stefanus

分类：机器学习 | 计算机视觉 | (统计)机器学习

2022-07-14

对比学习是一种表示方法，该方法是通过将样品与其他类似样本进行对比，以使它们紧密地将其结合在一起，从而在特征空间中形成簇。学习过程通常是使用两阶段训练架构进行的，它利用对比度损失（CL）进行功能学习。对比度学习已被证明在处理不平衡数据集方面非常成功，其中某些课程的代表性过高，而另一些类的代表性不足。但是，以前的研究并未针对数据集进行不平衡的CL进行专门修改。在这项工作中，我们引入了一个不对称版本的Cl（称为ACL），以直接解决类不平衡问题。此外，我们提出了不对称的局灶性对比损失（AFCL）作为ACL和局灶性对比损失（FCL）的进一步概括。 FMNIST和ISIC 2018不平衡数据集的结果表明，AFCL能够以加权和未加权分类精度优于CL和FCL。在附录中，我们在熵上提供完整的公理处理以及完整的证明。

translated by 谷歌翻译

Test-time Adaptation for Real Image Denoising via Meta-transfer Learning

Agus Gunawan , Muhammad Adi Nugroho , Se Jin Park

分类：计算机视觉

2022-07-05

近年来，已经对真实图像deno的任务进行了大量研究。但是，通过创建更好的网络体系结构来改善真实图像的努力。我们探索了一个不同的方向，我们建议通过更好的学习策略来改善真实图像deno的性能，该策略可以在多任务网络上进行测试时间适应。学习策略是两个阶段，第一阶段使用元辅助学习预先培训网络以获得更好的元定位化。同时，我们使用元学习进行微调（元转移学习）作为培训的第二阶段，以实现对真实嘈杂图像的测试时间适应。为了利用更好的学习策略，我们还提出了一个具有自我监督的掩盖重建损失的网络体系结构。实际嘈杂数据集的实验显示了提出的方法的贡献，并表明该方法可以优于其他SOTA方法。

translated by 谷歌翻译

Understanding and Improving Group Normalization

Agus Gunawan , Xu Yin , Kang Zhang

分类：计算机视觉

2022-07-05

已经提出了各种归一化层来帮助培训神经网络。组归一化（GN）是在视觉识别任务中实现出色表现的有效和有吸引力的研究之一。尽管取得了巨大的成功，但GN仍然存在几个问题，可能会对神经网络培训产生负面影响。在本文中，我们介绍了一个分析框架，并讨论了GN在影响神经网络训练过程时的工作原理。从实验结果中，我们得出结论GN对批处理标准化（BN）的较低性能的真正原因：1）\ TextBf {不稳定的训练性能}，2）\ TextBf {更敏感}对失真，无论是来自外部噪声还是扰动。通过正规化。此外，我们发现GN只能在某个特定时期内帮助神经网络培训，而BN可以帮助整个培训中的网络。为了解决这些问题，我们提出了一个新的归一化层，该层是通过合并BN的优势在GN顶部构建的。图像分类任务的实验结果表明，所提出的归一化层优于官方GN，以提高识别精度，无论批次大小如何，并稳定网络训练。

translated by 谷歌翻译

Towards deep observation: A systematic survey on artificial intelligence techniques to monitor fetus via Ultrasound Images

Mahmood Alzubaidi , Marco Agus , Khalid Alyafei , Khaled A Althelaya , Uzair Shah , Alaa Abd-Alrazaq , Mohammed Anbar , Michel Makhlouf , Mowafa Househ

分类：机器学习 | 计算机视觉

2022-01-17

开发旨在增强胎儿监测的创新信息学方法是生殖医学研究的新领域。已经对人工智能（AI）技术进行了几项评论，以改善妊娠结局。他们的限制是专注于特定数据，例如怀孕期间母亲的护理。这项系统的调查旨在探讨人工智能（AI）如何通过超声（US）图像帮助胎儿生长监测。我们使用了八个医学和计算机科学书目数据库，包括PubMed，Embase，Psycinfo，ScienceDirect，IEEE Explore，ACM图书馆，Google Scholar和Web of Science。我们检索了2010年至2021年之间发表的研究。从研究中提取的数据是使用叙述方法合成的。在1269项检索研究中，我们包括了107项与调查中有关该主题的查询的不同研究。我们发现，与3D和4D超声图像（n = 19）相比，2D超声图像更受欢迎（n = 88）。分类是最常用的方法（n = 42），其次是分割（n = 31），与分割（n = 16）集成的分类和其他其他杂项，例如对象检测，回归和增强学习（n = 18）。妊娠结构域中最常见的区域是胎儿头（n = 43），然后是胎儿（n = 31），胎儿心脏（n = 13），胎儿腹部（n = 10），最后是胎儿的面孔（n = 10）。在最近的研究中，深度学习技术主要使用（n = 81），其次是机器学习（n = 16），人工神经网络（n = 7）和增强学习（n = 2）。 AI技术在预测胎儿疾病和鉴定怀孕期间胎儿解剖结构中起着至关重要的作用。需要进行更多的研究来从医生的角度验证这项技术，例如试点研究和有关AI及其在医院环境中的应用的随机对照试验。

translated by 谷歌翻译

Traversing the Local Polytopes of ReLU Neural Networks: A Unified Approach for Network Verification

Shaojie Xu , Joel Vaughan , Jie Chen , Aijun Zhang , Agus Sudjianto

分类：机器学习 | (统计)机器学习

2021-11-17

尽管具有Relu激活功能的神经网络（NNS）在广泛的应用中找到了成功，但它们在风险敏感环境中的采用受到对稳健性和可解释性的担忧受到限制。以前的作品来检查稳健性，并改善解释性部分地利用了Relu Nn的分段线性函数形式。在本文中，我们探讨了relu nns在输入空间中创建的独特拓扑结构，识别分区本地多台之间的邻接并基于这种邻接的遍历算法。我们的Polytope Travering算法可以适用于验证与鲁棒性和解释性相关的广泛网络属性，提供统一的方法来检查网络行为。由于遍历算法显式访问所有本地多台面，因此它返回遍历区域内的网络行为清晰和完整的图像。遍历算法的时间和空间复杂性由通过穿过遍历区域的Relu NN分区超平面的数量来确定。

translated by 谷歌翻译

Designing Inherently Interpretable Machine Learning Models

Agus Sudjianto , Aijun Zhang

分类：机器学习 | (统计)机器学习

2021-11-02

可解释的机器学习（IML）在与人类健康和安全或基本权利有关的高度监管的行业方面变得越来越重要。通常，由于它们的透明度和解释性，应采用固有的IML模型，而具有模型无关的解释性的黑匣子型号可能更难以在监管审查下抵御。为了评估机器学习模型的固有可解释性，我们提出了一种基于特征效果和模型架构约束的定性模板。它为高性能IML模型开发提供了设计原则，其中通过审查我们最近的exnn，gami-net，simtree和aletheia工具包的实例，以实现深度Relu网络的局部线性解释性。我们进一步展示了如何设计一种可解释的Relu DNN模型，评估概念性的概念性研究，用于预测家庭贷款中的信用违约。我们希望这项工作将在银行业的高风险应用中，以及其他行业提供实用的IML模型的实用指导。

translated by 谷歌翻译